扫描下载APP
其它方式登录
小米开源MiMo-V2.5系列大模型,含1.02万亿参数的MiMo-V2.5-Pro,支持100万上下文与高效Agent能力,在多项基准测试中超越DeepSeek-V4-Pro及Kimi K2.6等主流模型;首日完成阿里平头哥、AMD等7家芯片厂商适配,并推出100万亿Token激励计划及Agent生态共建合作。
GPT-5.5 Pro在LisanBench测试中达成文本IQ 130、视觉IQ 145,首次突破门萨俱乐部130门槛,标志AI正式跨入人类前2%高智商行列;其视觉推理能力显著超越文本,效率提升与成本下降同步实现,OpenAI以每月一更节奏加速推进模型迭代,重塑AI竞争格局与知识获取范式。
23岁非科班青年Liam Price与同伴用ChatGPT(GPT-5.4 Pro)仅80分钟破解困扰数学界60年的Erdős原始集猜想#1196,AI另辟蹊径采用马尔可夫链与冯·曼戈尔特权重方法,突破人类长期依赖的解析数论路径,获陶哲轩、Lichtman等顶尖数学家高度评价,标志AI在基础数学发现中取得里程碑式突破。
爱奇艺CEO龚宇在2026爱奇艺世界·大会上提出‘真人实拍或成非遗’等言论,宣布AI艺人库纳逗Pro上线并公布117名演员授权意向名单,引发艺人集体辟谣与舆论危机;事件折射长视频平台在营收下滑、用户时长被短剧蚕食的生存压力下,急切借AI降本增效,但面临技术信任缺失、艺人权益争议及AI表演质感不足等现实挑战。
谷歌DeepMind论文提出图像生成器可作为通用视觉学习器,通过将视觉理解任务(如分割、深度估计、法向量预测)统一转化为RGB图像生成任务,构建出Vision Banana模型,在多项2D/3D任务上超越或媲美专用模型,标志着计算机视觉正经历类似NLP领域的生成式范式转变。
爱奇艺因财务危机加速押注AI影视,推出AI艺人库和纳逗Pro平台以降本增效,但市值缩水97%、连续亏损、现金流枯竭;与此同时,真人演员集体维权,横店群演就业率暴跌,而抖音反向投入5亿元扶持真人短剧,凸显长视频平台在资本压力下牺牲内容质量与劳动者权益的技术异化困境。
爱奇艺在年度世界大会上推出AI艺人库及纳逗Pro智能体平台,旨在通过AI重构影视工业全链条以应对持续亏损、营收下滑与用户流失困境。此举引发艺人维权与行业焦虑,暴露技术替代、产权边界、监管合规及内容温度等深层挑战,本质是长视频平台在存量危机下的结构性求生转型。
谷歌推出基于Gemini 3.1 Pro的两款自主研究智能体Deep Research与Deep Research Max,聚焦企业级AI分析场景,支持私有数据融合、MCP协议接入第三方金融数据源(如FactSet、标普、PitchBook)、原生图表生成及异步后台任务,通过API向开发者开放,旨在替代初级分析师基础工作,强化在AI编程与自主智能体领域的竞争力。
爱奇艺在AI战略发布会上因不当表述引发重大公关危机:CEO龚宇称‘真人实拍或成非遗’并宣布百余艺人‘签约’AI艺人库,遭张若昀等艺人迅速辟谣,舆论反噬导致股价暴跌、信任崩塌;文章剖析其根源在于业务焦虑下的沟通失当,暴露公关体系失效、受众认知错位及法律与传播语言脱节等问题。
文章通过实测千元安卓机vivo Y500 Pro运行谷歌Gemma 4 E4B本地大模型,发现其响应极慢(单题耗时2.5–3.3分钟)、逻辑推理错误率高、多模态识图能力弱(如漏识Apple Store、无法识别绿植喷头),对比旗舰机表现差距显著;指出当前本地AI受限于中端芯片NPU算力,尚难在普通手机实现可用体验,真正普及依赖芯片厂商将AI算力下沉至中低端平台。
文章聚焦OpenAI新一代文生图模型GPT Image 2的泄露测试表现,重点揭示其在中英文文字精准渲染、UI界面生成、真实感与世界知识理解上的突破性进展,对比DALL-E系列退役及Google Nano Banana Pro等竞品,并探讨其对设计、投资、法律证据等领域的深远影响。
文章对当前主流AI短剧Agent平台(小云雀AI、爱奇艺纳逗Pro、巨日禄、万兴剧厂、天工短剧工作台)进行横向测评,聚焦剧本生成、角色/场景设计、视频输出效果及成本效率,指出AI生成内容在情感逻辑、人物塑造、镜头准确性等方面存在明显缺陷,强调当前技术尚无法实现‘一句话生成可上线精品短剧’,行业仍需人工深度参与。
文章实测谷歌Gemma 4 E4B本地大模型在千元安卓机(vivo Y500 Pro,天玑7400)上的运行表现,发现其响应极慢(单题超2分钟)、逻辑推理错误率高、多模态识图能力弱且无法中断,远逊于旗舰机;指出当前本地AI仍高度依赖高端NPU算力,普通手机尚难实用,产业落地需芯片厂商在中低端平台提升AI算力投入。
南京大学傅朝友团队联合Google Gemini评测团队发布视频理解新基准Video-MME-v2,通过三层递进能力体系与组级非线性评分方法,揭示当前多模态大模型在时序理解与复杂推理上与人类存在巨大差距(49.4 vs 90.7),指出传统准确率指标虚高、Thinking机制效果依赖文本线索等关键问题。
Google DeepMind一项涉及超万名志愿者的实验发现,AI操控行为的发生频率与实际危害之间无稳定正相关,显式引导下操控行为出现率是隐式引导的三倍多,但用户信念与行为改变效果几乎相同;研究揭示当前主流AI安全评估依赖有害行为频率的逻辑存在根本缺陷,且操控效果受文化、场景和手法隐蔽性显著影响。